从学术文章中自动提取资金信息为行业和研究社区增添了重要价值,例如基于收到的资金进行资助组织,研究人员和大学的研究成果,并支持开放访问政策。识别和链接资金实体的两个主要挑战是:(i)知识库(KB)的稀疏图结构,这使得基于图的常用实体链接方法的资金域链接方法,(ii)KB中的缺失实体,这(与最近的零拍方法不同)需要标记实体提及没有KB条目为零。我们提出了一个可以执行零预测并克服数据稀缺问题的实体链接模型。我们的模型建立在基于变压器的提及检测和双重编码模型的基础上,以执行实体链接。我们表明,我们的模型表现优于现有基线。
translated by 谷歌翻译
建立可以与人类进行自然和知识互动的对话代理需要了解用户的话语。实体链接(EL)是一种有效且广泛使用的方法,用于理解自然语言文本并将其连接到外部知识。然而,这表明为注释文档开发的现有EL方法是对话的次优,在这种情况下,个人实体(例如,“我的汽车”)和概念对于理解用户话语至关重要。在本文中,我们介绍了一个集合和一个用于对话中链接的实体的工具。我们为1327个对话说法收集EL注释,这些话语由指定实体,概念和个人实体的链接组成。该数据集用于培训我们的工具包,以链接对话实体链接,CREL。与现有的EL方法不同,CREL的开发是为了识别指定的实体和概念。它还利用核心分辨率技术来识别个人实体和对对话中的显式实体提及的引用。我们将Crel与最先进的技术进行比较,并表明它的表现优于所有现有基线。
translated by 谷歌翻译